Dirección de brecha de logits: un diagnóstico de paso hacia adelante para la robustez de alineación Brecha de logits: diagnóstico de robustez en alineación. Descubre esta métrica clave para evaluar la confianza y seguridad en modelos de IA. 2026-05-05 · 2 min